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Adaptive Speicheruna von Audiosiqnalen 



Die Erfindung betrifft ein Verfahren zur Speicherung von Audiosignalen, 
insbesondere von Sprachnachrichten. Weiter betrifft die Erfindung auch eine 
Vorrichtung, die ein Mittel zur Digitalisierung von eingehenden Audiosignalen, 
ein Speichermittel zur Speicherung derselben, sowie eine Steuerungs- 
einrichtung umfasst, sowie Computerprogramme und insbesondere geeignete 
Servereinheiten, Signalisierungseinrichtungen, Prozessorbaugruppen und 
programmierbare Gate-Array-Baugruppen zur Unterstutzung und Durchfuhrung 
eines derartigen Verfahrens. 



Die Aufnahme von Audio- und insbesondere Sprachsignalen wird heutzutage 
digital durchgefuhrt, wobei Audio- oder Sprach-Kodiergerate und ein digitaler 
Speicher Verwendung finden. Vor dem eigentlichen Abspeichern werden die 
digitalisierten Audiosignale in der Regel komprimiert. Dadurch werden 
irrelevante und redundante Informationen aus dem Datenstrom entfemt. 
Aufgrund von Echtzeit-Bedingungen und anderen nicht-idealen Umstanden, wie 
beispielsweise begrenzte Rechenkapazitat oder Unsicherheit uber die 
Eigenschaften der Quelle der Audiosignale ist diese Art der Signalbearbeitung 
nicht verlustfrei. Die nach der Abspeicherung wieder aufgerufenen und 
dekodierten Audiosignale bzw. Sprachdaten sind im Verhaltnis zum Original 
fast immer in ihrer Qualitat reduziert. Die Qualitat der abgespeicherten 
Audiosignale bzw. kodierter Sprachnachrichten ist immer ungefahr umgekehrt 
proportional zum Kompressionsfaktor: Je starker die Kompression, desto 
geringer wird anschliefiend die Qualitat des reproduzierten Signals sein. 
Umgekehrt ist bei einer hohen Qualitat der abgespeicherten Signale stets ein 
recht umfangreicher Speicherplatz erforderlich. 

Die Qualitatsreduktion der Signale hangt also offenbar von der Bitrate des 
komprimierten Datenstroms ab, die beispielsweise zwischen 4 und 12 kbit/s 
liegen wird. Im Gegensatz zur Bandspeicherung kann die digitale Information 
heutzutage in schnellen RAM oder anderen digitalen Speichermitteln 
unterschiedlicher Art abgelegt werden, die zwar auch ihrer Grolie nach 
reduziert sind, aber einen beliebigen Zugriff (= random access) erlauben. 

Wegen der ublichen Instationaritat der Quellinformation (Stille, Sprache, 
stimmhafte und stimmlose Abschnitte) sollte die Bitrate naturlich moglichst 
variabel sein. Wegen des speziellen Kanals - im Speichermittel - mit 
asynchronen Eigenschaften, ist das Kodieren mit einer variablen Bitrate moglich 
und gebrauchlich. Dadurch kann die Instationaritat der Quelle einfach 
ausgenutzt werden, was sich schlielilich in der mittleren Bitrate eines Codes 
wiederspiegelt. Dieser Durchschnitt wird ublicherweise uber „mittlellange" 
Sprachproben erhalten. 



Die ublichen Gerate mit digitaler Audio- bzw. Sprachaufzeichnung weisen einen 
begrenzten, aber in der Regel wahlfrei zugreifbaren Speicher auf, der 
beispielsweise die Funktion eines Anrufbeantworters erfullen kann. 

Aus dem Lehrbuch ..SPEECH CODING AND SYNTHESIS" von W.B. Kleijn, 2. 
Auflage, 1998, Seiten 5 bis 7, ist das Abspeichern von eingehenden 
Sprachsignalen mit variabler Bitrate bekannt, wo.bei im Falle einer erhohten 
Speicherbelegung neu eingehende Signale mit einer niedrigeren Bitrate 
abgespeichert werden sollen als die bereits im Speicher abgespeicherten 
Signale. Die letzteren jedoch werden nicht verandert, und es wird auch kein 
neuer Speicherbereich durch diese Prozedur freigemacht. 

Nachteilig bei diesem bekannten Verfahren ist, dass sich damit eine 
ungleichmaliige Qualitat der zeitlich hintereinander abgespeicherten Signale 
ergibt, wobei die neueren Signale eine schlechtere Qualitat aufweisen als die 
bereits abgelegten alteren. Der zur Verfugung stehende Gesamtspeicherplatz 
kann daher keineswegs optimal ausgenutzt werden, weil insbesondere die 
alteren abgespeicherten Signale einen zu grolien Speicherbereich wegnehmen. 
Aufierdem kann bereits bei jiingeren Signalen nach diesem Verfahren eine 
Qualitatsreduktion vorgenommen werden, die moglicherweise gar nicht 
erforderlich ware, wenn nicht weitere, noch jiingere Signale folgen. 

Aus der US-A 5,546, 395 ist ein Verfahren zur dynamischen Selektion der 
Kompressionsrate von Sprachnachrichten bekannt, die digital uber eine 
Telefonleitung ubertragen werden. Die Kompressionsrate hangt ab von der 
Bandbreite des Telekommunikations-Kanals und von der Geschwindigkeit der 
Ubertragung. Der Kompressionsfaktor wird folglich in Abhangigkeit dieser 
beiden extremen Faktoren geandert, Das bekannte Verfahren ist nur zur 
Signaliibertragung, aber nicht zur Signalspeicherung geeignet, insbesondere 
nicht zu einer optimierten Belegung von vorhandenem Speicherplatz in einem 
Speichermittel. 



Sobald der Kodieralgorithmus zusammen mit der oben erwahnten, 
korrespondierenden durchschnittlichen Bitrate ausgewahlt ist, ist bei dem 
bekannten Verfahren in der Regel die Sprachqualitat und das Maximum der 
speicherbaren Kapazitat bestimmt und ein fur allemal festgelegt. Die maximale 
Speicherdauer ist aber eine aufierst wichtige Spezifikation beim Vergleich von 
konkurrierenden Produkten auf dem Markt untereinander. 

Wahrend des ublichen Gebrauchs beobachtet man haufig, dass das 
Speichermittel sich nur langsam fullt und sehr oft uber einen langen Zeitraum 
und einem grofien Bereich leer bleibt, bevor ein Abruf der gespeicherten 
Nachrichten und eine Loschung derselben stattfindet, wodurch der Speicher 
wieder geleert wird. Das bedeutet, dass es fur jede denkbare Situation besser 
ware, die Information mit einer hoheren Bitrate zu speichern, um die Moglichkeit 
einer hoheren Reproduktionsqualitat zu geben, und die Information nur in dem 
Umfang zu komprimieren, der erforderlich ist, um neue Daten abzuspeichern. 

Gleichzeitig sollte es moglich sein, dass ein Sprachsignal beliebiger Lange bis 
zu seiner maximalen Lange aufgenommen wird, ohne dass eine Unterbrechung 
stattfindet. Die bestmogliche Reproduktionsqualitat sollte also fur jede beliebige 
(ubliche) Lange erreicht werden. 

Aufgabe der vorliegenden Erfindung ist es daher, ein Verfahren der eingangs 
beschriebenen Art mit moglichst einfachen Mitteln dahingehend weiterzubilden, 
dass der zur Verfugung stehende Speicherplatz optimal ausgenutzt werden 
kann, wobei eine Qualitatsreduktion von Signalen dann, und nur dann 
vorgenommen werden soil, wenn dies wirklich notwendig ist, um neuere Signale 
abspeichern zu konnen, wobei der Grad einer Qualitatsreduktion so geringfugig 
wie moglich sein sollte und wobei die jungsten eingehenden Signale gegenuber 
den bereits gespeicherten alteren Signalen keine Qualitatsreduktion erfahren 
sollten. 



ErfindungsgemaU wird diese Aufgabe auf ebenso uberraschend einfache wie 
wirkungsvolle Art und Weise durch folgende Verfahrensschritte gelost : 

(a) Digitalisieren von eingehenden Audiosignalen; 

(b) Speichern der digitalisierten Audiosignale in Bereichen mit einer ersten 
Speichergrofie bzw. Bitrate in einem Speicher; 

(c) Uberwachen der Belegung des Speichers; 

(d) Feststellen des aktuellen Belegungsgrades, insbesondere einer 
vollstandigen Belegung des Speichers; 

(e) Reduzieren der Speichergrofie bzw. Bitrate der bereits abgespeicherten 
Audiosignale auf einen zweiten, kleineren Wert, sobald ein vorgegebener 
Belegungsgrad des Speichers erreicht ist; und 

(f) Belegen des im Speicher freiwerdenden Speicherplatzes zumindest 
teilweise mit neu eingehenden Audiosignalen. 

Das erfindungsgemafie Verfahren funktioniert auch bei quellenabhangiger, 
variabel-ratiger Kodierung der eingehenden Audiosignale. 

Es wird eine digitale Audio- bzw. Sprachaufzeichnung mit begrenztem, aber 
wahlfrei zugreifbarem Speicher erreicht, wobei die Wiedergabegute unter 
Beibehaltung einer stets garantierbaren maximalen Speicherdauer durch 
bessere Ausnutzung des sich nur langsam fiillenden Speichers und eventuell 
unter Ausnutzung des gewohnlichen Benutzerverhaltens, wie beispielsweise 
Benutzungspausen, erheblich verbessert wird. Insbesondere wird auch eine 
unterbrechungslose Konversationsaufnahme mit dem erfindungsgemafien 
Verfahren ermoglicht. 



Wenn Benutzungspausen dies erlauben, kann zusatzlich eine nahezu 
verlustfrei qualitatserhaltende Recodierung der abgespeicherten Signale a(n) 
stattfinden. Dadurch kann die fur die Operation erforderliche Rechenkapazitat 
auf Pausenzeiten verlegt werden und ist wahrend Empfangszeiten fur andere 
Operationen frei. Aufierdem steht der dadurch gewonnene Speicherplatz gleich 
dem nachsten eingehenden Signalpaket zur Verfiigung. 

Weiterhin kann zwischen Sprachkodierern mit niedriger Bitrate und niedriger 
Qualitat oder solchen mit hoherer Qualitat aber auch hoherer Bitrate gewahlt 
werden. Im ersten Fall ergibt sich eine lange maximale Aufzeichnungsdauer, 
wahrend die Aufzeichnungsdauer in den anderen Fallen kurzer wird. 

Wie bereits erwahnt, kann mit dem erfindungsgemalien Verfahren eine der 
niedrigsten Bitrate entsprechende maximale Speicherdauer in jedem 
Benutzungsfall garantiert werden. 

Bei der Aufnahme eines Signals fu lit sich das Speichermittel nur langsam und 
wird daher nur selten vollstandig ausgenutzt. Bei leerem Speicher erfolgt 
zunachst eine Aufzeichnung mit hoher Bitrate und entsprechend hoher 
Wiedergabequalitat solange, bis der Speicher zu einem bestimmten Grad gefullt 
ist. Anschliefiend wird die Speichergrolie der bereits abgespeicherten 
Audiosignale verringert, so dass ein vorgegebener Belegungsgrad des 
Speichers nicht uberschritten wird. 

Besonders bevorzugt ist eine Variante des erfindungsgemafien Verfahrens, bei 
der die neu eingehenden Audiosignale in Schritt (b) mit derselben Bitrate im 
Speicher abgespeichert werden wie die bereits oder noch im Speicher 
vorhandenen. Dadurch lasst sich eine gleichmafJige Bitrate aller gespeicherten 
Audiosignale gewahrleisten. 

Vorteilhaft ist auch eine alternative Verfahrensvariante, bei der die neu 
eingehenden Audiosignale in Schritt (b) mit einer hoheren Bitrate im Speicher 



abgespeichert werden als die bereits Oder noch vorhandenen. Mit dieser 
Verfahrensvariante kann eine bessere Ausnutzung des vorhandenen 
Speicherplatzes bei einer Bevorzugung von Jungeren" eingehenden Signalen 
erreicht werden. 

Bei einer vorteilhaften Weiterbildung dieser Verfahrensvariante wird in Schritt 
(e) die SpeichergrolJe bzw. Bitrate bereits abgespeicherter Audiosignale a(n) 
abhangig vom Alter bzw. der Aufenthaltsdauer der betreffenden Audiosignale 
a(n) im Speicher reduziert. Dies ermoglicht eine differenziertere Behandlung der 
bereits gespeicherten Nachrichten, wobei das Kriterium fur ein Uberschreiben 
nicht unbedingt die Reihenfolge der Eintragung ist, was beispielsweise bei 
kurzzeitig aufeinanderfolgenden Einspeicherungen unangemessen ware, 
sondern das (moglicherweise sogar „eingepragte") Alter der Nachricht und 
damit ihre (inverse) Dringlichkeit und Relevanz. 

Zusatzlich oder alternativ erfolgt bei einer weiteren bevorzugten 
Verfahrensvariante das Reduzieren der Speichergrblie in Schritt (e) durch 
Recodieren der bereits abgespeicherten Audiosignale mit einer geringeren 
Bitrate als bei ihrer Einspeicherung in Schritt (b). Diese Verfahrensvariante ist 
besonders einfach und effizient durchfuhrbar. Es kann eine optimale 
Ausnutzung der vorhandenen Speicherkapazitat in Abhangigkeit vom aktuellen 
Datenanfall ermoglicht werden. Aufcerdem kann die Recodierung auch nicht- 
kausal in Bezug auf die Zeitrichtung der bereits abgespeicherten Signale 
vorgenommen werden. 

Vorteilhaft ist eine Weiterbildung dieser erfindungsgemafien 
Verfahrensvariante, bei der vor dem Recodieren die Audiosignale hinsichtlich 
ihres Informationsgehalts analysiert und die analysierten Parameter der 
Audiosignale unabhangig von ihrer zeitlichen Lage fur die Recodierung 
verwendet werden. Dadurch kann auch eine ..ruckwarts gerichtete" statistische 
Abhangigkeit, also eine hochgradig nicht-kausale Betrachtungsweise 
angewandt werden. Dies ermoglicht es, die Stutzstellen im zeitlichen Verlauf 



des zu speichernden und spater interpolierend zu reproduzierenden 
Audiosignals auch erst nach Kenntnis des gesamten Signals zu setzen. 

Besonders bevorzugt ist auch eine alternativ einsetzbare Verfahrensvariante, 
die sich dadurch auszeichnet, dass die eingehenden Audiosignale in 
hierarchischer Weise geschichtet in Ebenen von unterschiedlich wichtigen 
Informationsblocken codiert werden, und dass das Reduzieren der 
Speichergrofie in Schritt (e) durch sukzessives Weglassen der jeweils untersten 
Ebene bzw. Ebenen der hierarchisch geschichteten Informationsblocke erfolgt. 
Fur diese Verfahrensvariante ist uberhaupt kein Rechenaufwand erforderlich, 
da keine Recodierung von bereits vorhandenen, abgespeicherten 
Audiosignalen erfolgt. Es mussen lediglich Speicherbereiche nach einem 
bestimmten vorgegebenen Muster uberschrieben werden. 

Das hierarchische Codieren an sich ist beispielsweise bekannt aus der 
US-A 5,815,097. Allerdings wird dort kein hierarchisches Abspeichern von 
Daten beschrieben und ein hierarchisches Uberschreiben von empfangenen 
Audiosignalen in einem Speichermedium ist nicht einmal andeutungsweise 
offenbart. 

Bei einer bevorzugten Weiterbildung der oben genannten Verfahrensvariante 
erfolgt die Schichtung der unterschiedlichen Informationsblocke gemafi 
mindestens einem vbrgebbaren Wichtigkeitskriterium. Damit ergeben sich 
vielfaltige Mbglichkeiten des Einsatzes des erfindungsgemalien Verfahrens. 

Als Wichtigkeitskriterium kann beispielsweise die Mittenfrequenz eines im 
Audiosignal enthaltenen Frequenz- bzw. Sprachbandes gewahlt werden, so 
dass im Bedarfsfall in Schritt (e) die oberen Frequenzen des Audio- bzw. 
Sprachsignals weggelassen werden konnen. 

Alternativ oder zusatzlich kann als Wichtigkeitskriterium ein mittlerer Fehler, 
vorzugsweise ein mittlerer quadratischer Fehler einer Parameterdarstellung des 



Audiosignals, insbesondere einer Mehrstufen-Vektorquantisierung gewahlt 
werden, wobei im Bedarfsfall in Schritt (e) eine oder mehrere hohere Stufen der 
Parameterdarstellung vernachlassigt werden konnen. 

Ebenfalls alternativ oder zusatzlich konnen in den Audiosignalen Sprachpausen 
erkannt und hierarchisch auf einer unteren Stufe eingeordnet werden. 

Ebenso konnen in den Audiosignalen Hintergrundgerausche erkannt und 
hierarchisch auf einer unteren Stufe eingeordnet werden. 

Diese Verfahrensvariante lasst sich vorteilhaft dahingehend weiterbilden, dass 
im Bedarfsfall in Schritt (e) in den Audiosignalen aktuell vorhandene naturliche 
Hintergrundgerausche durch kunstliche, insbesondere synthetische 
Gerauschsignale (=comfort noise) ersetzt werden. 

Bei einer weiteren Verfahrensvariante schlielilich wird als Belegungsgrad des 
Speichers, ab dem in Schritt (e) eine Reduktion der SpeichergroUe bzw. Bitrate 
erfolgt, der Wert von 100% des im Speicher zur Verfugung stehenden 
Speicherplatzes vorgegeben, also die absolute Vollbelegung. Dadurch lasst 
sich eine besonders gute Ausnutzung der Eigenschaften des 
erfindungsgemafien Verfahrens erzielen; insbesondere wird eine 
Qualitatsreduktion von bereits abgespeicherten Signalen erst dann 
vorgenommen, wenn dies aus Speicherplatzgrunden wirklich unumganglich ist. 

In den Rahmen der vorliegenden Erfindung fallt auch eine Servereineit, eine 
Prozessor-Baugruppe sowie eine Gate-Array-Baugruppe zur Unterstutzung des 
oben beschriebenen erfindungsgemalien Verfahrens sowie ein 
Computerprogramm zur Durchfuhrung des Verfahrens. Das Verfahren kann 
sowohl als Hardwareschaltung, als auch in Form eines Computerprogramms 
realisiert werden. Heutzutage wird eine Software-Programmierung fur 
leistungsstarke DSP's, z.B. in modernen Mobiltelefonen bevorzugt, da neue 
Erkenntnisse und Zusatzfunktionen leichter durch eine Veranderung der 



Software auf bestehender Hardwarebasis implementierbar sind. Verfahren 
konnen aber auch als Hardwarebausteine beispielsweise in IP- Oder TK- 
Endgeraten oder herkommlichen Telefonanlagen implementiert werden. 

Weiterhin fallt in den Rahmen der vorliegenden Erfindung auch eine Vorrichtung 
mit den eingangs genannten Merkmalen, wobei das Speichermittel Bereiche mit 
einer ersten Speichergrofce zur Speicherung der digitalisierten Audiosignale 
aufweist; wobei die Steuerungseinrichtung Mittel zur Detektion einer Belegung 
aller Bereiche des Speichermittels aufweist; wobei das Mittel zur Digitalisierung, 
wenn festgestellt wird, dass ein vorgegebener Belegungsgrad der Bereiche des 
Speichermittels, insbesondere eine vollstandige Belegung erreicht ist, eine 
Kompression der bereits abgespeicherten Audiosignale von der ersten 
Speichergrolie auf eine zweite, kleinere Speichergrofie vornehmen kann; und 
wobei die Steuerungseinrichtung neu eingehende Audiosignale auf frei 
gewordenen Speicherplatz im Speichermittel ablegen kann. 

Weitere Vorteile der Erfindung ergeben sich aus der Beschreibung und der 
Zeichnung. Ebenso konnen die vorstehend genannten und die noch weiter 
aufgefuhrten Merkmale erfindungsgemafi jeweils einzeln fur sich oder zu 
mehreren in beliebigen Kombinationen Verwendung finden. Die gezeigten und 
beschriebenen Ausfuhrungsformen sind nicht als abschlieliende Aufzahlung zu 
verstehen, sondern haben vielmehr beispielhaften Charakter fur die Schilderung 
der Erfindung. 

Die Erfindung ist in der Zeichnung dargestellt und wird anhand von Ausfuh- 
rungsbeispielen naher erlautert. Es zeigen : 

Fig. 1 ein Schema fur die digitale Codierung von Audiosignalen, 

insbesondere Sprachnachrichten und Abspeicherung auf einem 
Speichermittel sowie zur Wiedergabe; 



Fig. 2 



eine schematische Darstellungsweise einer hierarchischen 
Speicherbelegung; 



Fig. 3 



eine parallele Codierung von neu eingehenden Audiosignalen s(n) 
und von bereits abgespeicherten Audiosignalen a(n); 



Fig. 4 



ein Schema der hierarchischen Codierung mit den zugehorigen 
Datenstromen; und 



Fig. 5 



ein Schema des erfindungsgemafien Uberschreibens von 
niedrigen hierarchischen Stufen im Speichermittel mit neu 
eingehenden Audiosignalen. 



In Fig. 1 ist schematisch fur eine mit einem Mikrofon- und einem 
Lautsprechersymbol angedeutete Audio-Verbindung, insbesondere eine 
Telekommunikationsverbindung gezeigt, wie ein Audiosignal s(n) in einer 
Codiereinrichtung 1 1 in ein digitalisiertes und komprimiertes Signal a(n), 
beispielsweise mit einer Bitrate zwischen 4 und 12 kbit/s digitalisiert und 
komprimiert und anschliedend in einem Speichermittel 12 abgespeichert wird. 
Von dort konnen Audiodaten b(n) abgerufen und in einem Decodierer 13 
rekonstruiert und als Audiosignal s(n) einem Lautsprecher zugefuhrt werden. 

Um bei der Rekonstruktion der abgerufenen und decodierten Audiosignale eine 
hohere durchschnittliche Qualitat zu erreichen, wahrend gleichzeitig eine 
gewisse garantierte maximale Speicherkapazitat auch bei neu eingehendem 
Audiodatenstrom erhalten bleibt, wird gemafl einer Ausfuhrungsform der 
vorliegenden Erfindung vorgeschlagen, die im Speichermittel 12 
abgespeicherten komprimierten Audiodaten in einer bestimmten Weise zu 
uberschreiben: 

Zu Beginn werden in das zunachst leere Speichermittel die Audiosignale mit 
hoher Bitrate (und entsprechend hoher Reproduktionsqualitat) abgespeichert, 



bis der Speicher voll ist, wie in Fig. 2 angedeutet, wenn insgesamt J 
Nachrichten bzw. Pakete von Audiosignalen eingegangen sind. 

Danach werden die abgespeicherten Signale mit einer niedrigeren Bitrate und 
entsprechend hoherer Kompression codiert und ein Teil der Information, die 
bereits im Speichermittel 12 abgespeichert ist, wird uberschrieben. 

Um zu ermoglichen, dass die bereits abgespeicherten Audiosignale immer noch 
vernunftig rekonstruierbar bleiben, gibt es mehrere Moglichkeiten: 

In Fig. 3 ist eine Ausfuhrungsform des erfindungsgemaden Verfahrens 
dargestellt, bei der eine Art „fliegende" Kompression der Audiodaten 
vorgenommen wird. Hierbei werden in der Codiereinrichtung 1 1 die 
eingehenden Neu-Daten s(n), wie in Fig. 1 gezeigt, digitalisiert und komprimiert 
und als Datenstrom a(n) dem Speichermittel 12 zugefuhrt. Parallel dazu werden 
die bereits im Speichermittel 12 abgespeicherten, komprimierten Audiodaten in 
einem Codec 14 weiterkomprimiert und als Datenstrom a'(n) dem 
Speichermittel 12 zugefuhrt. Diese zweite Kompression von bereits 
gespeicherter Information schafft genugend freien Speicherplatz im 
Speichermittel 12, so dass der eingehende Audiodatenstrom a(n), der von der 
parallel dazu arbeitenden Codiereinrichtung 11 kommt, ebenfalls auf dem 
Speichermittel 12 abgespeichert werden kann. 

Hierfur wird allerdings eine gewisse Rechenkapazitat fur die beiden parallelen 
Codieroperationen erforderlich. 

Bei einer weiteren, in Fig. 4 angedeuteten Moglichkeit der Audiodaten- 
Verarbeitung gemafi der vorliegenden Erfindung kann dieser Rechenkapazitat 
eingespart werden. 

Hier werden die eingehenden Audiosignale s(n) zunachst in einer 
hierarchischen Codiereinrichtung 21 nach einem hierarchischen Codierschema 



digitalisiert und komprimiert. Dabei werden die Audiosignale in einer Weise 
codiert, dass sie einen hierarchisch geordneten Datenstrom ergeben, wie in Fig. 
4 angedeutet ist. Dieser Datenstrom wird (was in Fig. 4 der Einfachheit halber 
weggelassen wurde) entsprechend hierarchisch geschichtet in einer Menge von 

komprimierten Datenstrdmen a-i(n), a2(n) a m (n) einer Speichereinheit 

zugefuhrt, wo die komprimierten Daten entsprechend hierarchisch abgelegt 
werden. Von dort konnen sie wiederum bei Bedarf abgerufen und in einem 
ebenfalls hierarchisch organisierten Decodierer 23 zu einem Audiosignal s(n) 
zusammengesetzt und einem Lautsprecher zugefuhrt werden. 

Die Kerninformation, die in Fig. 4 mit dem Datenstrom a-i(n) bezeichnet ist, 
bildet die Lage 1, die in der hierarchischen Schichtung der Daten die oberste 
Stelle einnimmt. Diese komprimierten Audiodaten konnen benutzt werden, um 
das eingehende Audiosignal s(n) mit der niedrigst moglichen Genauigkeit zu 
rekonstruieren. Dies entspricht der niedrigst moglichen Bitrate bzw. der 
hochstmoglichen Kompressionsstufe. 

Wenn zusatzliche Schichten 2, 3 zur Lage 1 hinzugenommen werden, wird das 
rekonstruierte Signal in seiner Qualitat verbessert. Bei der Verwendung 
samtlicher Schichten bis zur Schicht m ergibt sich die hochstmogliche Bitrate 
und damit die hochstmogliche Reproduktionsqualitat des decodierten Signals. 
Dieser Fall entspricht dem hoch-ratigen Codieren, welches zu Beginn einer 
Einspeicherung des eingehenden Audiosignals angewandt wird. Die 
abgespeicherten Schichten 1 bis m fur die unterschiediichen Signalpakete, wie 
sie im Speichermittel 12 vorliegen, sind im iibrigen auch in Fig. 2 gezeigt. 

Man kann nun verschiedene Strategien anwenden, um mit diesem 
hierarchischen Schema von m Schichten bei Bedarf Speicherplatz im 
Speichermittel 12 freizumachen. Eine wichtige Ausfuhrungsform des 
erfindungsgemafien Verfahrens ist in Fig. 5 dargestellt, wo in dem Fall, wenn 
der Speicherplatz im Speichermittel 12 mit J abgespeicherten 
Audiosignalpaketen voll belegt ist, ein neu eingehendes Audiosignalpaket J + 1 



auf die unterste Schicht m mit den "unwichtigsten" hierarchischen Daten 3 
uberschrieben wird. Es bleiben daher fur die bereits abgespeicherten 
Audiosignale 1 bis J nur noch m - 1 Schichten ubrig. 

Das neue eingehende Audiosignalpaket J + 1 kann entweder mit der gleichen, 
nunmehr reduzierten Bitrate, also in m - 1 Schichten, oder mit der ursprunglich 
maximal moglichen Anzahl von m hierarchischen Schichten eingespeichert 
werden. Im ersteren Falle waren samtliche im Speichermittel 12 
abgespeicherten Signalpakete mit untereinander gleichma&iger Qualitat 
vorhanden, im letzteren Falle wurden neu eingehende Signalpakete gegenuber 
alteren hinsichtlich ihrer Qualitat aufgrund einer hoheren Anzahl von 
hierarchischen Schichten bevorzugt. 

Wenn der durch die oben beschriebene Prozedur gewonnene Speicherplatz 
wiederum aufgebraucht und das Speichermittel 12 mit abgespeicherten 
Audiosignalpaketen voll ist, konnen nach dem gleichen Schema durch 
Uberschreiben der jeweils untersten hierarchischen Schichten der 
abgespeicherten Signalpakete Schritt fur Schritt die fur die Rekonstruktion der 
Audiosignale erforderlichen Daten uberschrieben werden, wobei aufgrund der 
abnehmenden hierarchischen Nummer der jeweils uberschriebenen 
Datenschicht und damit der zunehmenden "Wichtigkeit" fur die Rekonstruktion 
des Signals die maximal mogliche Signalqualitat bei der Rekonstruktion stetig 
abnimmt. Auf diese Weise konnen mehr und mehr neue Signale bei gleicher 
Speicherkapazitat auf dem Speichermittel 12 abgespeichert werden, bis 
schliefilich nur noch die oberste hierarchische Schicht bereits fruher 
abgespeicherter Audiosignale ubrig bleibt. Wird auch diese noch uberschrieben, 
sind die entsprechenden Audiosignalpakete aus dem Speichermittel 12 vollends 
geloscht. Dies kann beispielsweise bei einem Anrufbeantworter eine lange 
zuruckliegende Sprachnachricht sein, die aktuell keine Relevanz mehr hat. 



Der Kompressionsfaktor fur diese niedrigste Codierungsstufe definiert daher die 
maximale Speicherkapazitat des Systems, die unter alien Umstanden garantiert 
werden kann. 

Es sei darauf hingewiesen, dass der oben beschriebene hierarchische 
Uberschreibungsmechanismus eine graduelle Verminderung der Qualitat der 
abgespeicherten Information mit sich bringt, die aber nur dann erfolgt, wenn 
dies notwendig ist, um neue Informationen auf dem begrenzten 
Speichermedium aufzunehmen. 

Ideal ware dieses Verfahren, wenn man unendlich viele hierarchische Schichten 
von beliebig hoher Feinheit einfuhren konnte. Dies wird naturlich in der Praxis 
nicht moglich sein, sondern man muss sich auf eine endliche Anzahl von 
hierarchischen Schichten beschranken. Wenn die hierarchische Codierung 
exakt genauso effizient wie ein nicht-hierarchischer Codieralgorithmus arbeiten 
wurde, konnte die optimale Losung der oben genannten Erfindungsaufgabe 
erreicht werden. Diese Losung ware dann unabhangig von der Anzahl der 
abzuspeichernden Datenpakete und der Algorithmus wiirde immer die optimale 
Rekonstruktionsqualitat fur alle Datenpakte zu jeder Zeit unter Benutzung einer 
vorhandenen begrenzten Speicherkapazitat sicherstellen. 

Fur beide oben vorgestellten Moglichkeiten einer Uberschreibung von bereits 
belegtem Speicherplatz ist es bemerkenswert, dass der erfindungsgemal3>e 
Mechanismus in jedem Fall funktioniert, sogarwenn keine Pausenzeiten 
vorliegen, in denen das System nicht benutzt wird. Dies kommt insbesondere 
dann vor, wenn im Falle einer Anrufbeantwortermaschine ein Gesprach 
aufgezeichnet werden muss und es von vorne herein nicht bekannt ist, welche 
Zeitdauer das aufzuzeichnende Gesprach einnehmen wird. Speziell in diesem 
Falle soil ja die garantierte maximale Speicherkapazitat des Systems so hoch 
wie moglich sein. 



Die erfindungsgemafie Uberschreibungstechnik ist auch kompatibel mit einem 
Verfahren, bei dem quellenabhangig eine variable Bitrate eingesetzt wird. Um 
im Bild von Fig. 5 zu bleiben, ware dann die Dicke der hierarchischen Schichten 
variabel bzw. die Zeitskala wurde zwischen zwei Grenzwerten variieren, wenn 
man den Speicher 12 durchlauft. 

Eine weitere Verbesserung der Ausfuhrungsformen des erfindungsgemaden 
Verfahrens kann erreicht werden, wenn die letzteren kombiniert werden mit 
einem Offline-, nicht - Echtzeit, nicht - kausalem Recodieren, welches in 
Ruhepausen des Systems durchgefuhrt wird, wenn keine neuen Audiosignale 
eingehen. Dadurch kann die maximal nutzbare Speicherkapazitat in vielen 
Fallen abhangig vom Benutzerverhalten erheblich gesteigert werden. 

Im Falle von Sprachcodierung mit einer Bitrate zwischen 12 und 4 kbit/s kann 
die Verbesserung aufgrund der Anwendung des erfindungsgemalien 
Verfahrens folgendermafien quantifiziert werden: Eine Codierung mit 12 kbit/s 
beispielsweise mit einem GSM-EFR Codec ergibt nahezu die Qualitat einer . 
"Leitungsubertragung" gemafl ETSI. Eine Codierung mit 4 oder 3 kbit/s, die in 
der Regel bei einem Anrufbeantworter angewendet werden durfte, wie er 
derzeit auf dem Markt erhaltlich ist, ergibt eine signifikant niedrigere Qualitat, 
aber die Sprache sollte noch so weit verstandlich bleiben, dass die darin 
ubermittelten Nachrichten verstanden werden konnen. Daraus kann man 
schlieUen, dass bei der Verwendung der erfindungsgemaden Technik die 
Speicherkapazitat um einen Faktor 2 bis 3 abhangig von der Effizienz des 
hierarchischen Codierungsschemas erhoht werden kann im Verhaltnis zur 
Benutzung eines Codec mit der hochsten Bitrate. 

Weiterhin ist das erfindungsgemafie Verfahren erheblich effizienter als eines, 
welches lediglich die Bitrate der neu eingehenden Audiosignale wahrend des 
Betriebs reduziert, wenn der zur Verfugung stehende Speicherplatz abnimmt. 



Die Verwendung des oben erwShnten hochgradigen Codec alleine wurde zwar 
eine gute Sprachqualitat fur die meisten zu erwartenden Falle ergeben und in 
dieser Hinsicht mit den Bedurfnissen der Verbraucher ubereinstimmen, ware 
aber schon deswegen praktisch nicht moglich, weil dadurch die garantierte 
maximale Speicherkapazitat zu weit beschrankt wurde. Mit dem Verfahren nach 
der vorliegenden Erfindung hingegen wird dies moglich, ohne dass dafur die 
maximale Speicherkapazitat "geopfert" werden musste. 



Patentanspruche 



1 . Verfahren zur Speicherung von Audiosignalen, insbesondere von 
Sprachnachrichten, mit folgenden Verfahrensschritten: 

(a) Digitalisieren von eingehenden Audiosignalen s(n); 

(b) Speichern der digitalisierten Audiosignale a(n) in Bereichen mit 
einer ersten Speichergrofie bzw. Bitrate in einem Speicher (12); 

(c) Uberwachen der Belegung des Speichers (12); 

(d) Feststellen des aktuellen Belegungsgrades, insbesondere einer 
vollstandigen Belegung des Speichers (12); 

(e) Reduzieren der SpeichergrofJe bzw. Bitrate der bereits 
abgespeicherten Audiosignale a(n) auf einen zweiten, kleineren 
Wert, sobald ein vorgegebener Belegungsgrad des Speichers 
(12) erreicht ist; und 

(f) Belegen des im Speicher (12) freiwerdenden Speicherplatzes 
zumindest teilweise mit neu eingehenden Audiosignalen s(n). 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
zusatzlich ein Reduzieren der SpeichergroUe bzw. Bitrate der 
bereits abgespeicherten Audiosignale a(n) in Benutzungspausen 
erfolgt, wenn gerade keine neu eingehenden Audiosignale s(n) 
empfangen werden. 



•a 



Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass 
die neu eingehenden Audiosignale s(n) in Schritt (b) mit derselben 
Bitrate im Speicher (12) abgespeichert werden wie die im Speicher 
(12) noch vorhandenen Audiosignale a(n). 

Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass 
die neu eingehenden Audiosignale s(n) in Schritt (b) mit einer 
hoheren Bitrate im Speicher (12) abgespeichert werden als die 
bereits vorhandenen. 
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Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass in 
Schritt (e) die Speichergrofie bzw. Bitrate bereits abgespeicherter 
Audiosignale a(n) abhangig vom Alter bzw. der Aufenthaltsdauer der 
betreffenden Audiosignale a(n) im Speicher (12) reduziert wird. 



6. Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass das Reduzieren der Speichergrofie in Schritt 
(e) durch Recodieren der bereits abgespeicherten Audiosignale a(n) 
mit einer geringeren Bitrate als bei ihrer Einspeicherung in Schritt (b) 
erfolgt. 

7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass vor dem 
Recodieren die Audiosignale a(n) hinsichtlich ihres 
Informationsgehalts analysiert und die analysierten Parameter der 
Audiosignale a(n) unabhangig von ihrer zeitlichen Lage fur die 
Recodierung verwendet werden. 



8. Verfahren nach einem der Anspruche 1 bis 5, dadurch 
gekennzeichnet, dass die eingehenden Audiosignale s(n) in 
hierarchischer Weise geschichtet in Ebenen von unterschiedlich 
wichtigen Informationsblocken cod iert werden, und dass das 



Reduzieren der Speichergrolie in Schritt (e) durch sukzessives 
Weglassen der jeweils untersten Ebene bzw. Ebenen der 
hierarchisch geschichteten Informationsblocke erfolgt. 

9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die 
Schichtung der unterschiedlichen Informationsblocke gemali 
mindestens einem vorgebbaren Wichtigkeitskriterium erfolgt. 

10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass als 
Wichtigkeitskriterium die Mittenfrequenz eines im Audiosignal s(n) 
enthaltenen Frequenzbandes gewahlt wird, und dass im Bedarfsfall 
in Schritt (e) die oberen Frequenzen des Audiosignals weggelassen 
werden. 

11. Verfahren nach Anspruch 9 oder 10, dadurch gekennzeichnet, dass 
als Wichtigkeitskriterium ein mittlerer Fehler, vorzugsweise ein 
mittlerer quadratischer Fehler einer Parameterdarstellung des 
Audiosignals s(n), insbesondere einer Mehrstufen- 
Vektorquantisierung gewahlt wird, und dass im Bedarfsfall in Schritt 
(e) eine Oder mehrere hohere Stufen der Parameterdarstellung 
vernachlassigt werden. 

12. Verfahren nach einem der Anspruche 8 bis 11, dadurch 
gekennzeichnet, dass in den Audiosignalen s(n) Sprachpausen 
erkannt und hierarchisch auf einer unteren Stufe eingeordnet 
werden. 

13. Verfahren nach einem der Anspruche 8 bis 12, dadurch 
gekennzeichnet, dass in den Audiosignalen s(n) 
Hintergrundgerausche erkannt und hierarchisch auf einer unteren 
Stufe eingeordnet werden. 



14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass im 
Bedarfsfall in Schritt (e) in den Audiosignalen s(n) aktuell 
vorhandene naturliche Hintergrundgerausche durch kunstliche, 
insbesondere synthetische Gerauschsignale (=comfort noise) 
ersetzt werden. 

15. Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass als Belegungsgrad des Speichers (12), ab 
dem in Schritt (e) eine Reduktion der Speichergrofle bzw. Bitrate 
erfolgt, 100% des im Speicher (12) zur Verfugung stehenden 
Speicherplatzes vorgegeben wird. 

16. Vorrichtung zur Speicherung von Audiosignalen, insbesondere von 
Sprachnachrichten, die ein Mittel (11; 21) zur Digitalisierung von 
eingehenden Audiosignalen s(n), ein Speichermittel (12) zur 
Speicherung derselben, sowie eine Steuerungseinrichtung umfasst, 

wobei das Speichermittel (12) Bereiche mit einer ersten 
Speichergrolie zur Speicherung der digitalisierten Audiosignale a(n) 
aufweist; 

wobei die Steuerungseinrichtung Mittel zur Detektion einer Belegung 
aller Bereiche des Speichermittels (12) aufweist; 

wobei das Mittel (11; 21) zur Digitalisierung, wenn festgestellt wird, 
dass ein vorgegebener Belegungsgrad des der Bereiche des 
Speichermittels (12), insbesondere eine vollstandige Belegung 
erreicht ist, eine Kompression der bereits abgespeicherten 
Audiosignale a(n) von der ersten SpeichergroBe auf eine zweiten, 
kleinere Speichergrolie vornehmen kann; und 



wobei die Steuerungseinrichtung neu eingehende Audiosignale s(n) 
auf frei gewordenen Speicherplatz im Speichermittel (12) ablegen 
kann. 



17. Prozessorbaugruppe, insbesondere digitaler Signalprozessor 
(=DSP) zur Unterstutzung des Verfahrens nach einem der 
Anspruche 1 bis 15. 

18. Programmierbare Gate-Array-Baugruppe zur Unterstutzung des 
Verfahrens nach einem der Anspruche 1 bis 15. 

19. Computerprogramm zur Durchfuhrung des Verfahrens nach einem 
der Anspruche 1 bis 15. 
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Zusammenfassunq 



Ein Verfahren zur Speicherung von Audiosignalen, insbesondere von 
Sprachnachrichten, umfasst folgende Verfahrensschritte: 

(a) Digitalisieren von eingehenden Audiosignalen; 

(b) Speichem der digitalisierten Audiosignale in Bereichen mit einer 
ersten Speichergrofte bzw. Bitrate in einem Speicher; 

(c) Uberwachen der Belegung des Speichers; 

(d) Feststellen des aktuellen Belegungsgrades, insbesondere einer 
vollstandigen Belegung des Speichers; 

(e) Reduzieren der SpeichergroBe bzw. Bitrate der bereits 
abgespeicherten Audiosignale auf einen zweiten, kleineren Wert, 
sobald ein vorgegebener Belegungsgrad des Speichers erreicht 
ist; und 

(f) Belegen des im Speicher freiwerdenden Speicherplatzes 
zumindest teilweise mit neu eingehenden Audiosignalen. 

Damit kann der zur Verfugung stehende Speicherplatz optimal 
ausgenutzt werden, wobei eine Qualitatsreduktion von Signalen dann, 
und nur dann vorgenommen wird, wenn dies wirklich notwendig ist, urn 
neuere Signale abspeichern zu konnen, wobei der Grad einer 
Qualitatsreduktion so geringfiigig wie moglich ist und wobei die 
jungsten eingehenden Signale gegenuber den bereits gespeicherten 
alteren Signalen keine Qualitatsreduktion erfahren. 

(Fig-3) 
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